一輪對話(One-turn Conversation):使用者輸入一個prompt,AI回覆一句話。這是最基本的互動模式,沒有上下文記憶,也就是說,每次問問題,模型都會重新思考,不會記得之前說過什麼。
模型內部運作流程
首先使用者輸入prompt,這句話會先被tokenizer拆成一個個token(文字編碼)。
再來模型會根據prompt的token,查表取出對應的embedding(向量表示),經過多層 Transformer(注意力機制),預測下一個最可能的token。
生成過程會一個token一個token地接龍:先預測第一個字,把預測的字加回輸入,再預測下一個字,重複直到遇到結束符號。
最後再由tokenizer解碼成我們能看的自然語句。
但模型不會記得這次對話的內容,下一次重新問,它會再重新思考。
一輪對話實作